ASP.NET| php| javascript| ASP| perl| Jsp| vbscript| java| CSS/HTML| C#| C/C++| Python/Ruby MFC| QT| Delphi/Pascal| Objective-c| Google Go| Shell| Android| IOS| 移动编程| Windows Phone| 综合编程| 正则表达式| 编程技术| 其他语言|

当前位置：首页 > 脚本编程 > Python/Ruby >

如何使用python爬虫新闻？

来源:网络整理作者: 发布时间:2020-12-19 20:52

jquery中文网为您提供如何使用python爬虫新闻？等资源，欢迎您收藏本站，我们将为您提供最新的如何使用python爬虫新...

首先，打开开发者模式，分析网页。

利用这个方法，我们很轻松就找到了新闻文字内容的位置，通过分析发现其内容都为p标签下的字符串，并且其class="one-p"，这可以作为定位该内容的唯一特征。

实例代码：

大家可以利用小编的这个方法，去找到想要找的内容文字，方法不仅简单，还很容易操作，直接复制粘贴即可哦~如果还想了解其他内容，可以到python学习网上去查询哦~

现在时事是人们最在意的话题，而且对于新闻行业来说，掌握第一手新闻资料，可是独家新闻，大爆炸，其他圈子小编不清楚，但是娱乐圈，想必大家都知道吧，像第一手资料的狗仔，一直是人们津津乐道的话题，所以怎么去获取第一手资料呢，大家可以跟着小编来学习下，最新新闻的获取内容哦~

找到内容文字

通过以上的分析，我们确定了定位关键信息的方法，接下来就可以编写python程序了：

# -*- coding:utf-8 -*-import requests from bs4 import BeautifulSoup url = "https://new.qq.com/omn/20190704/20190704A0EHMR00.html"r = requests.get(url) rr = r.content bs = BeautifulSoup(rr,"lxml") news_contents = bs.find_all("p",{'class':'one-p'}) news_final = ""for i in news_contents: print(i.string) if i.string: news_final = news_final i.string "\n"f = open("news_contents.txt",'w') f.write(news_final) f.close()

最终打开保存的文件，里面就是获取的新闻内容了哦~

具体做法：按F12，并用ctrl f对elements进行搜索，关键字为新闻内容的几个字即可。

相关热词： python

本站内容来源于网络，如有侵权请与我们联系，我们会及时删除，我们深感抱歉！
注：本站所有信息仅供用于网络技术学习参考,学习中请遵循相关法律法规！

本文地址: https://v30.fanwenzhu.com/jiaob/python/5782.shtml

上一篇：python爬虫ip代理池是什么？

下一篇：python和c语言哪个简单

相关文章

最新文章

python日常一利用python抓取

python日常一利用python抓取

时间：2021-01-17

一个 ARP 请求分组询问协议

一个 ARP 请求分组询问协议

时间：2021-01-17

此时就需要web抓取

此时就需要web抓取

时间：2021-01-17

这节我们使用Bootstrap

这节我们使用Bootstrap

时间：2021-01-17

我们该如何运用Python 来统

我们该如何运用Python 来统

时间：2020-12-27

python生成汉字图片字库

python生成汉字图片字库

时间：2020-12-26

python通过protobuf实现rpc

python通过protobuf实现rpc

时间：2020-12-26

djngo快速实现使用Bootstra

djngo快速实现使用Bootstra

时间：2020-12-26

热门文章

python中制表符是什么意思

python中制表符是什么意思

时间：2020-12-19

python利用format方法保留三位小数

python利用format方法保留三位小数

时间：2020-12-19

python的for循环怎么理解

python的for循环怎么理解

时间：2020-12-19

python根据年份月份输出天数

python根据年份月份输出天数

时间：2020-12-19

python日常一使用python抓取拉勾网职位信息

python日常一使用python抓取拉勾网职位信息

时间：2020-12-26

python实现计算列表元素之和

python实现计算列表元素之和

时间：2020-12-19

python输出结果怎么换行

python输出结果怎么换行

时间：2020-12-20

python实现字符串逆序输出

python实现字符串逆序输出

时间：2020-12-20

winpython是什么

winpython是什么

时间：2020-12-20

python中swapcase是什么意思

python中swapcase是什么意思

时间：2020-12-20

Copyright © www.juheyunku.com 关于 | 合作 | 声明 | 联系 | 更新 | 地图 | Tags

如何使用python爬虫新闻？

2020-12-19　编辑：

首先，打开开发者模式，分析网页。

利用这个方法，我们很轻松就找到了新闻文字内容的位置，通过分析发现其内容都为p标签下的字符串，并且其class="one-p"，这可以作为定位该内容的唯一特征。

实例代码：

大家可以利用小编的这个方法，去找到想要找的内容文字，方法不仅简单，还很容易操作，直接复制粘贴即可哦~如果还想了解其他内容，可以到python学习网上去查询哦~

现在时事是人们最在意的话题，而且对于新闻行业来说，掌握第一手新闻资料，可是独家新闻，大爆炸，其他圈子小编不清楚，但是娱乐圈，想必大家都知道吧，像第一手资料的狗仔，一直是人们津津乐道的话题，所以怎么去获取第一手资料呢，大家可以跟着小编来学习下，最新新闻的获取内容哦~

找到内容文字

通过以上的分析，我们确定了定位关键信息的方法，接下来就可以编写python程序了：

# -*- coding:utf-8 -*-import requests from bs4 import BeautifulSoup url = "https://new.qq.com/omn/20190704/20190704A0EHMR00.html"r = requests.get(url) rr = r.content bs = BeautifulSoup(rr,"lxml") news_contents = bs.find_all("p",{'class':'one-p'}) news_final = ""for i in news_contents: print(i.string) if i.string: news_final = news_final i.string "\n"f = open("news_contents.txt",'w') f.write(news_final) f.close()

最终打开保存的文件，里面就是获取的新闻内容了哦~

具体做法：按F12，并用ctrl f对elements进行搜索，关键字为新闻内容的几个字即可。

本站内容来源于网络，如有侵权请与我们联系，我们会及时删除，我们深感抱歉！
注：本站所有信息仅供学习参考！
本文地址为 https://v30.fanwenzhu.com/jiaob/python/5782.shtml

相关文章

风云图片

python日常一利用python抓取

python日常一利用python抓取

一个 ARP 请求分组询问协议

一个 ARP 请求分组询问协议

此时就需要web抓取

此时就需要web抓取

这节我们使用Bootstrap

这节我们使用Bootstrap

我们该如何运用Python 来统

我们该如何运用Python 来统

python生成汉字图片字库

python生成汉字图片字库

推荐阅读

返回Python/Ruby频道首页